关于 4 位量化 的快讯列表
| 时间 | 详情 | 
|---|---|
| 
                                            2024-08-27 03:28  | 
                                
                                     
                                        
                                            Vitalik Buterin 讨论 FLUX 开发性能
                                        
                                         
                                根据 Vitalik Buterin 的说法,由于他的 4070 GPU 只有 8 GB 的 VRAM,FLUX 开发推理过程大约需要 5 分钟,这需要使用 enable_sequential_cpu_offload(),导致性能变慢。他提到使用 4 位量化可能适用,但尚未测试。此外,手动编辑大约需要 10 分钟,第二轮修补大约需要 1 分钟。  |